
********************************************************************************************************************
************************************************  Vorgeschriebener Code, Janys **********************************************
                               


                                                                                                                 
********************************************************************************************************************

clear all

***use "personal_sa1_b2015_3655_dsf.dta", clear


*** Version festlegen
**version <13>

*** Bildschirmausgabe steuern
set more off
set logtype text
set linesize 255 

*** Ado-Pfad festlegen
**sysdir set PERSONAL "<Pfad wird im Forschungsdatenzentrum ergänzt>"
**mata mata mlib index

*** Makros für Pfade
global datenpfad "E:\fdz-gast10\janys_3655-2018\daten\"
global outputpfad "E:\fdz-gast10\janys_3655-2018\output\output_20180906\"

*** Makros für Datei- und Outputnamen
**global dateiname <dateiname.dta> /*Dateiname einfügen*/
global outputname output   /*Outputname einfügen*/


********************************************************************************************************************
*** Aufzeichung in Protokoll starten.
capture log close
log using "$outputpfad\$outputname.log", replace

********************************************************************************************************************
********************************************************************************************************************
********************************************************************************************************************
********************************************************************************************************************
********************************************************************************************************************
*** Titel des Projekts: 			<Distributional Aspects of Discrimination>
*** Datengrundlage: 				<Personal-und Stellenstatistik 2015>
***
*** Dateiname des Programmcodes: 	<syntaxname.do>
*** erstellt: 						<Datum> 
*** von: 							<Lena Janys> 
*** E-Mail: 						<ljanys@uni-bonn.de> 
*** Tel.: 							<0228-73 9183> 
*** 
*** Dateiname des Output-Files: 	<outputname.log> 
*** 
*** 
*** Grundriss des Programms: 
***			<Programm zur Untersuchung von Anteilen von Frauen innerhalb von Fachbereichen und Universitten in Deutschland, deskriptive Analysen> 
***
*** 
*** Verwendete Variablen: 
*** Originalvariablen: 	
***			   	EF2:    Berichstland 
*** 			EF3:   	Hochschulnummer
*** 			EF5:  	Kategorie
*** 			EF6:  	Lehr- und Forschungsbereich
*** 			EF11:  	Fachgebiet
*** 			EF12:  	Dienstbezeichnung
*** 			EF13:  	Ttigkeit
***				EF14:  	Arbeitszeit
*** 			EF18:  	Dienstverhltnis
***				EF19: 	Beschftigung
***             EF20:   Laufbahngruppe
***				EF21:   Besoldungs- und Vergtungsgruppe
*** 			EF22:	Art der Finanzierung
***				EF23:	Geschlecht
***				EF24:	Geburtsmonat
***				EF25:	Geburtsjahr
***				EF28: 	Staatsangehrigkeit	
***				EF30:	Jahr der 1. Berufung zum Professor

*** Neu angelegte Variablen in dieser Syntax <syntaxname.sas>:  
***tba***
*** 
*** Anmerkung: Falls Variablen verwendet werden, die in einer vorherigen Syntax erstellt wurden, 
*** diese bitte in separaten Blöcken auflisten.   
***            
***
***
********************************************************************************************************************
********************************************************************************************************************

**cd "E:\fdz-gast10\janys_3655-2018\daten\

********************************************************************************************************************
*** I. Datenaufbereitung
********************************************************************************************************************

***Umbennen und recoden des Hochschulfinanzdatensatzes****

**use "E:\fdz-gast10\janys_3655-2018\daten\hsf_2013_hochschularten.dta", clear

use "$datenpfad\hsf_2013_hochschularten.dta"

***Remove additional zero from the numbers***
gen ef3=substr(HS_Nr, 2,5)
replace ef3="9999" if ef3=="607A"
replace ef3="9998" if ef3=="607A"
replace ef3="9997" if ef3=="607B"
replace ef3="9996" if ef3=="607C"
replace ef3="9995" if ef3=="607D"
replace ef3="9994" if ef3=="607E"
replace ef3="9993" if ef3=="817A"
replace ef3="9992" if ef3=="817B"
replace ef3="9991" if ef3=="817C"
replace ef3="9989" if ef3=="817D"
replace ef3="9988" if ef3=="817E"
replace ef3="9986" if ef3=="810A"
replace ef3="8110" if ef3=="810B"
replace ef3="8120" if ef3=="810C"
replace ef3="8121" if ef3=="810D"
replace ef3="8122" if ef3=="810E"
replace ef3="8123" if ef3=="810F"
replace ef3="8124" if ef3=="810G"
replace ef3="8125" if ef3=="810H"
replace ef3="9985" if ef3=="817F"
replace ef3=subinstr(ef3,"0","",1)

drop if ef3=="620D" 

//**das war nicht im recoding enthalten, aber die einzige nicht numerische codierung im Dtaensatz**

destring ef3, replace

save "$datenpfad\Hochschularten_bearb.dta", replace

****Vorgeschriebene Mata Syntax falls ich es brauche***

***mata

***X = st_data(.,("ef2", "ef3", "ef5", "ef6", "ef11", "ef12", "ef13", "ef14", "ef18", "ef19", "ef20", "ef21", "ef22", "ef23", "ef24", "ef25", "ef28"))

***for (i=1; i<=n; i++) {

	
***}

***end mat

*** a. Datensatz einlesen

*** Alle Variablen einlesen

***use "personal_sa1_b2015_3655_dsf.dta", clear

***KIWI: Strukturfile enthlt kein ef30: noch hinzufgen, jetzt luft's durch

use ef2 ef3 ef5 ef6 ef11 ef12 ef13 ef14 ef18 ef19 ef20 ef21 ef22 ef23 ef24 ef25 ef28 ef30 using "$datenpfad\personal_sa1_b2015_3655.dta", clear

numlabel, add

***Ich behalte nur Professoren***
***keep if ef12=10|ef12=20|ef12=30|ef12==40|ef12=50
***110 sind Hochschuldozenten, 120 Universitätsdozenten, lasse ich mal drin wg. Besoldungsstufen. eventuell wieder raus.

keep if ef12==10|ef12==20|ef12==30|ef12==40|ef12==50
**|ef12==110
**|ef12==120

//**ef14==1 bedingt auf Vollzeit

**keep if ef14==1

***nur auf Dauer***

***keep if ef19==1

*** b. Generierung grobererer Fachgebietscodes. 

***Fr numerische Codierung**

***Aufpassen: in der Dokumentation sind alle Fachgebietscodes mit drei Ziffern, da aber alles numerisch codiert gibt es teilweise auch Beobachtungen mit 3 digits**

_strip_labels ef11

tostring ef11, gen(ef11s)

gen ef11onedigit=substr(ef11s, 1,1)

destring ef11onedigit, replace

****Some Universities are coded with double, triple codes, need to merge the same id***
***Fachhochschulen raus: folgende Restriktionen machen****

drop if ef3==730|ef3==740|ef3==821|ef3==822|ef3==860|ef3==880|ef3==910|ef3==1410|ef3==1550|ef3==1562|ef3==1570|ef3==1600|ef3==1610|ef3==1870|ef3==1910|ef3==1921|ef3==1922|ef3==2100|ef3==2150|ef3==2170|ef3==2190|ef3==2200|ef3==2220|ef3==2240|ef3==2272|ef3==2280|ef3==2290|ef3==2360|ef3==2410|ef3==2420|ef3==2430|ef3==5061|ef3==5062|ef3==20|ef3==30|ef3==32|ef3==33|ef3==34|ef3==35|ef3==40|ef3==50|ef3==60|ef3==170|ef3==170|ef3==750|ef3==760|ef3==790|ef3==940|ef3==1561|ef3==1532|ef3==1751|ef3==1760|ef3==1770|ef3==1780|ef3==1790|ef3==1830|ef3==1840

drop if ef3==1850|ef3==1940|ef3==1950|ef3==1960|ef3==1970|ef3==1980|ef3==1990|ef3==2110|ef3==2211|ef3==2440|ef3==2441|ef3==2490|ef3==3061|ef3==3062|ef3==3071|ef3==3072|ef3==3080|ef3==3090|ef3==4981|ef3==4982|ef3==4983|ef3==4991

drop if ef3==4992|ef3==5010|ef3==5020|ef3==5030|ef3==5050|ef3==5080|ef3==5090|ef3==5120|ef3==5130|ef3==5140|ef3==5150|ef3==5160|ef3==5170|ef3==5190|ef3==5220|ef3==5230|ef3==5240

drop if ef3>5230

replace ef3=101 if ef3==102|ef3==103

replace ef3=811 if ef3==812

replace ef3=1221 if ef3==1222

replace ef3=1311 if ef3==1312|ef3==1319

replace ef3=1378 if ef3==1379

replace ef3=1631 if ef3==1632|ef3==1639
     
replace ef3=2571 if ef3==2573

replace ef3=2581 if ef3==2582|ef3==2583

drop if ef6==986|ef6==900|ef6==990


***show also value labels****

numlabel, add

save "$datenpfad\working_data.dta", replace

***Ich erstelle einen Datensatz für Männer mit den relativen Haeufigkeiten innderhalb der Hochschule und Fachgebiets, einen für Frauen und merge dann

***da Stata keine three-way tables zulaesst**

***Einen Datensatz für Männer, "contract" erzeugt Häufigkeiten innerhalb der Hochschule (ef3) und des Lehr- und Forschungsbereichs (ef6)***

use "$datenpfad\working_data", clear

keep if ef23==1

contract ef6 ef3

tostring ef6, generate(ef6s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann, Verknüfung von Fachbereich und Universität***

tostring ef3, generate(ef3s)

gen m_id=ef6s+ef3s

destring m_id, replace

rename _freq _freqm

save "$datenpfad\ef3_ef6digit_men.dta", replace

***Einen Datensatz für Frauen ef23==2***

use "$datenpfad\working_data", clear

keep if ef23==2

contract ef6 ef3

tostring ef6, generate(ef6s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann, Verknüfung von Fachbereich und Universität***

tostring ef3, generate(ef3s)

gen m_id=ef6s+ef3s

destring m_id, replace

rename _freq _freqw

save "$datenpfad\ef3_ef6digit_women.dta", replace

****Die Datensätze von Männern und Frauen mergen***

merge 1:1 m_id using "$datenpfad\ef3_ef6digit_men.dta"

***Die relativen Häufigkeiten mit 0 ersetzen, wenn nur in master oder nur in using data***

replace _freqm=0 if _merge==1

replace _freqw=0 if _merge==2

****Generiere relative Häufigkeiten****

gen freq_total=_freqm+_freqw

***Neue Variable: relative Häufigkeit Frauen***

gen rel_freqw=_freqw/freq_total

save "$datenpfad\rel_freq_ef6digit.dta", replace

***Einen Datensatz für Männer, "contract" erzeugt Häufigkeiten innerhalb der Hochschule (ef3) und des Lehr- und Forschungsbereichs (ef6)***

use "$datenpfad\working_data", clear

keep if ef23==1

contract ef6 ef3

tostring ef6, generate(ef6s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann, Verknüfung von Fachbereich und Universität***

tostring ef3, generate(ef3s)

gen m_id=ef6s+ef3s

destring m_id, replace

rename _freq _freqm

save "$datenpfad\ef3_ef6digit_men.dta", replace

***Einen Datensatz für Frauen ef23==2***

use "$datenpfad\working_data", clear

keep if ef23==2

contract ef6 ef3

tostring ef6, generate(ef6s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann, Verknüfung von Fachbereich und Universität***

tostring ef3, generate(ef3s)

gen m_id=ef6s+ef3s

destring m_id, replace

rename _freq _freqw

save "$datenpfad\ef3_ef6digit_women.dta", replace

****Die Datensätze von Männern und Frauen mergen***

merge 1:1 m_id using "$datenpfad\ef3_ef6digit_men.dta"

***Die relativen Häufigkeiten mit 0 ersetzen, wenn nur in master oder nur in using data***

replace _freqm=0 if _merge==1

replace _freqw=0 if _merge==2

****Generiere relative Häufigkeiten****

gen freq_total=_freqm+_freqw

***Neue Variable: relative Häufigkeit Frauen***

gen rel_freqw=_freqw/freq_total

save "$datenpfad\rel_freq_ef6digit.dta", replace

***Die gleiche Prozedur wiederholen für 1-stellige Fachebreichscodes***

***Einen Datensatz für Männer, "contract" erzeugt Häufigkeiten innerhalb der Hochschule (ef3) und des Fachbereichs (ef11) (2 stellig)***

use "$datenpfad\working_data", clear

keep if ef23==1

contract ef11onedigit ef3

tostring ef11onedigit, generate(ef11s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann, Verknüfung von Fachbereich und Universität***

tostring ef3, generate(ef3s)

gen m_id=ef11s+ef3s

destring m_id, replace

rename _freq _freqm

save "$datenpfad\ef3_ef11onedigit_men.dta", replace

***Einen Datensatz für Frauen ef23==2***

use "$datenpfad\working_data", clear

keep if ef23==2

contract ef11onedigit ef3

tostring ef11onedigit, generate(ef11s)

***eine neue id variable erzeugen aufgrund dessen später gemerged werden kann***

tostring ef3, generate(ef3s)

gen m_id=ef11s+ef3s

destring m_id, replace

rename _freq _freqw

save "$datenpfad\ef3_ef11onedigit_women.dta", replace

****Die Datensätze von Männern und Frauen mergen***

merge 1:1 m_id using "$datenpfad\ef3_ef11onedigit_men.dta"

***Need to check this by example***

replace _freqm=0 if _merge==1

replace _freqw=0 if _merge==2

****Generiere relative Häufigkeiten****

gen freq_total=_freqm+_freqw

***Neue Var: relative Häufigkeit Frauen***

gen rel_freqw=_freqw/freq_total

save "$datenpfad\rel_freq_ef11onedigit.dta", replace

********************************************************************************************************************
*** II. Datenauswertung
********************************************************************************************************************

***Grundsätzlich ist die Auswertungsebene die Fakultät, bzw. meine Approximation davon, i.e. der Lehr- und Forschungsbereich (ef6) in Kombination mit 
***der Hochschule (ef3). Ich lösche alle Fakultäten in denen weniger als 3 Personen beschäftigt sind aus meinen Analysen. Min und Max in tabulate und sum***
***beziehen sich auf die Fakultätsebene, nicht auf Einzelpersonen**** 

*** Auswertungen: Tabulate: darstellen der relativen Frauenanteile innerhalb der Fachbereiche***
*** Output1: Ausgabe deskriptiver Kennzahlen ***

use "$datenpfad\working_data", clear


***Output 1 a: tabulate Frauen/Maenner

tab ef23

***Output 1 b: tabulate ef6***

tab ef6

***tabulate Jahr der Erstberufung****

tabulate ef30 if ef30<18|ef30>78

egen mode= mode(ef30)

tab(mode)

tabstat ef30, statistics(p50)

***Nur fuer Maenner***

tabulate ef30 if ef23==1&ef30<18|ef30>78 

***Nur fuer Frauen***

tabulate ef30 if ef23==2&ef30!=79&ef30!=82&ef30!=83&ef30!=85

***tabulate: Geburtsjahr***

tab ef25 if ef25>41&ef25<88

***tabulate: Fachbereich, Weiblich, drop Beobachtungen mit weniger als 3 Mitgliedern***

drop if ef6==990| ef6==900|ef6==990|ef6==195|ef6==910|ef6==986|ef6==860

tabulate ef6 ef23, cell
****für 3-stellige Fachbereichscodes/ Lehr-und Forschungsbereich ef6****
use "$datenpfad\rel_freq_ef6digit.dta", clear
***Um zu vermeiden dass man auf Einzelpersonen Werte zurückführen kann***
***freq_total gibt die absolute Anzahl der Fakultaetsgroesse an***
***Ich loesche alle Fakultaeten in denen weniger als 3 Professoren beschaeftigt sind***
drop if freq_total<3
***Ich lösche alle Fachbereiche von denen es weniger als 3 gibt***
drop if ef6==675|ef6==680
***Generiere Mittelwerte innerhalb der ef6 codes*** 
expand freq_total
by ef6, sort: egen efmeans=mean(rel_freqw)
***Berechne die Abweichungen der relativen Anteile von den Innergruppen Anteilen***
rename _merge _merge_mw
gen share_dev=rel_freqw-efmeans
***Output: 1 b: relativer Frauenanteil als Funktion des Lehr- und Forschungsbereichs***
***Inklusive Standardabweichung*****
***Fallzahlen für das gesamte Sample***
count if share_dev!=.
count if efmeans!=.
***Die Fallzahlen für die inner-Fachbereichsgrößen für Kurtosis, Mittelwert und Standarabweichung
by ef6: count
egen mean_ws= mean(efmeans)
egen mean_ef6=mean(efmeans), by(ef6)
***Mittelwert der Fakultätsgroessen, abhängig vom Fachbereich****
egen mean_fac=mean(freq_total)
egen mean_fac_ef6=mean(freq_total), by(ef6)
****Standard Deviation von Share Dev***
egen std=sd(share_dev)
egen std2=sd(share_dev), by(ef6)
egen N_obs=count(std2!=.), by(ef6)
egen kurtosis=kurt(share_dev), by(ef6)
***Korrelationen zwischen Frauenanteil und Abweichung, gewichtet****
pwcorr rel_freqw efmeans, obs
****Generiere absolute value der individuellen Abweichungen****
gen avd=abs(share_dev)
egen MAD=mean(avd), by(ef6)
***Laut des Merkblatts:N>=30
count
egen per1_mad=pctile(MAD),p(10) 
egen per2_mad=pctile(MAD),p(25) 
egen per3_mad=pctile(MAD),p(50) 
egen per4_mad=pctile(MAD),p(75) 
egen per5_mad=pctile(MAD),p(90) 
gen index=MAD/std2
****Fallzahlen auf denen die folgenden Grafiken basieren***
count
kdensity index, xline(0.79, lpattern(solid) lcolor(red) noextend) title("Distribution of MAD Index") xtitle(MAD Index) scheme(s2color)
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\Dist_mad_index.pdf", as(pdf) replace
graph twoway lpoly index efmeans, title("Local Polynomial Regression") xtitle(Female Share) ytitle(Index) scheme(s2color)
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\loc_pol_index_efmeans.pdf", as(pdf) replace
kdensity kurtosis, xline(3 4.070425, lpattern(solid) lcolor(red) noextend) title("Distribution of Kurtosis") xtitle(Kurtosis) note("The two bars indicate Kurtosis of Normal Distribution and the Sample Mean") scheme(s2color)
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kurtosis_density.pdf", as(pdf) replace
***Correlation excess kurtosis, efmeans***
pwcorr kurtosis efmeans, obs
***Test fuer Nomalitaet mit skewness und kurtosis****
sktest share_dev
sktest share_dev if ef6==290
sktest share_dev if ef6==100
sktest share_dev if ef6==250
sktest share_dev if ef6==50
sktest share_dev if ef6==830
sktest share_dev if ef6==440|ef6==470|ef6==490
sktest share_dev if ef6==340
sktest share_dev if ef6==400
sktest share_dev if ef6==315
sktest share_dev if ef6==360

*****Output 2: Grafiken bezüglich der Verteilung der Abweichung des Frauenanteils vom Mittelwert, ungewichtet***
***Für das gesamte Sample****
***Kerndichteschaetzer: stellt grafisch das Ergebnis einer Kerndichteschätzung dar, basierend auf einer Kernfunktion und einer Bandweite***
***Im Prinzip ein gewichteter, nichtlinearer Durchschnitt von Punkten in einer Nachbarschaft der Bandweite h mit K(x-x_i)****
***Es ist nicht möglich individuelle Beobachtungen zu identifizieren, per Definition des Kernschätzers****
count
kdensity share_dev, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal.pdf", as(pdf) replace

****Anzahl der Gesamt Beobachtungen****
count
***Die drei obersten Beobachtungen in einer Kategorie zusammenfassen***
replace share_dev=0.6 if share_dev>0.6 
***Histogram***
histogram share_dev, start(-.48787063) width(.0372367) normal fcolor(dimgray) fintensity(light) lcolor(black) normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) kdensity kdenopts(lcolor(red) lwidth(thick) lpattern(solid))
twoway__histogram_gen share_dev, freq start(-.48787063) width(.0372367) gen(h x)
***Die Fallzahlen der Histogram Bins***
list h if h!=.
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\hist_three_digit_normal_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\hist_three_digit_normal_uw.pdf", as(pdf) replace

***Für einige ausgewählte Fächer***
***Rechtswissenschaften ***
***Die Fallzahlen beziehen sich auf Departments/Fakultaeten mit mehr als 3 professoralen Mitgliedern***
count if ef6==250

kdensity share_dev if ef6==250, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Law") note("Female Share: 16%, Kurtosis: 4.05")  scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_law_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_law_uw.pdf", as(pdf) replace
***Wirtschaftswissenschaften****

count if ef6==290
kdensity share_dev if ef6==290, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Economics") note("Female Share: 19.2, Kurtosis: 6.61%")  scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ_uw.pdf", as(pdf) replace
***Politikwissenschaften***

count if ef6==230
kdensity share_dev if ef6==230, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Political Science") note("Female Share: 30%, Kurtosis: 2.53") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_polsci_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_polsci_uw.pdf", as(pdf) replace
***Geschichte***

count if ef6==50
kdensity share_dev if ef6==50, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, History") note("Female Share: 32.6%, Kurtosis: 4.78") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_history_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_history_uw.pdf", as(pdf) replace
***Informatik***

count if ef6==765
kdensity share_dev if ef6==765, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Computer Science") note("Female Share: 11.6%, Kurtosis: 3.82") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_cs_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_cs_uw.pdf", as(pdf) replace
***Musikwissenschaft**

count if ef6==830
kdensity share_dev if ef6==830, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Music") note("Female Share: 24.7%, Kurtosis: 9.37") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music_uw.pdf", as(pdf) replace
****Human Medizin***

count if ef6==440|ef6==470|ef6==490
kdensity share_dev if ef6==440|ef6==470|ef6==490, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Medicine") note("Female Share: 14.0-18.7%, Kurtosis: 3-4.62") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music_uw.pdf", as(pdf) replace
**** Mathematik***

count if ef6==340
kdensity share_dev if ef6==340, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Mathematics") note("Female Share: 15.9%, Kurtosis: 4.6") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_math_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_math_uw.pdf", as(pdf) replace
**** Biologie**

count if ef6==400
kdensity share_dev if ef6==400, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Biology") note("Female Share: 22.7%, Kurtosis: 2.74") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_bio_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_bio_uw.pdf", as(pdf) replace
**** Psychologie***

count if ef6==315
kdensity share_dev if ef6==315, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Psychology") note("Female Share: 38.7%, Kurtosis: 3.64") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_psy_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_psy_uw.pdf", as(pdf) replace
**** Germanistik***
count if ef6==100
kdensity share_dev if ef6==100, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, German")  note("Female Share: 46.1%, Kurtosis: 3.27") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_german_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_german_uw.pdf", as(pdf) replace
**** Physik***
count if ef6==360
kdensity share_dev if ef6==360, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Physics")  note("Female Share: 10.9%, Kurtosis: 5.72") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_physics_uw.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_physics_uw.pdf", as(pdf) replace

***Collapse Daten auf Fachbereichs/ Universitaets Ebene***
collapse (mean) kurtosis avd MAD per1_mad  per2_mad  per3_mad  per4_mad  per5_mad  index share_dev _freqw _freqm freq_total rel_freqw mean_ws mean_ef6 std std2 efmeans, by(ef6 ef3)
drop ef3

*****Output 3: Grafiken bezüglich der Verteilung der Abweichung des Frauenanteils vom Mittelwert, ungewichtet***
***Für das gesamte Sample****
***Kerndichteschaetzer: stellt grafisch das Ergebnis einer Kerndichteschätzung dar, basierend auf einer Kernfunktion und einer Bandweite***
***Im Prinzip ein gewichteter, nichtlinearer Durchschnitt von Punkten in einer Nachbarschaft der Bandweite h mit K(x-x_i)****
***Es ist nicht möglich individuelle Beobachtungen zu identifizieren, per Definition des Kernschätzers****
count
kdensity share_dev, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal.pdf", as(pdf) replace

****Anzahl der Gesamt Beobachtungen****
count 
***Die drei obersten Beobachtungen in einer Kategorie zusammenfassen***
replace share_dev=0.6 if share_dev>0.6 
***Histogram***
histogram share_dev, start(-.48787063) width(.0372367) normal fcolor(dimgray) fintensity(light) lcolor(black) normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) kdensity kdenopts(lcolor(red) lwidth(thick) lpattern(solid))
twoway__histogram_gen share_dev, freq start(-.48787063) width(.0372367) gen(h x)
list x if x!=.
***Die Fallzahlen der Histogram Bins***
list h if h!=.
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\hist_three_digit_normal.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\hist_three_digit_normal.pdf", as(pdf) replace

***Für einige ausgewählte Fächer***

***Rechtswissenschaften ***
***Die Fallzahlen beziehen sich auf Departments/Fakultaeten mit mehr als 3 professoralen Mitgliedern***
count if ef6==250
**kurtosis* 4.048532
kdensity share_dev if ef6==250, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Law") note("Female Share: 16%, Kurtosis: 4.05")  scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ.pdf", as(pdf) replace
***Wirtschaftswissenschaften****
**kurtosis 6.608371 **

count if ef6==290
kdensity share_dev if ef6==290, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Economics") note("Female Share: 19.2, Kurtosis: 6.61%")  scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_econ.pdf", as(pdf) replace
***Politikwissenschaften***
**kurtosis: 2.534315 **
count if ef6==230
kdensity share_dev if ef6==230, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Political Science") note("Female Share: 30%, Kurtosis: 2.53") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_polsci.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_polsci.pdf", as(pdf) replace
***Geschichte***
**kurtosis: 4.776112**
count if ef6==50
kdensity share_dev if ef6==50, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, History") note("Female Share: 32.6%, Kurtosis: 4.78") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_history.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_history.pdf", as(pdf) replace
***Informatik***
***kurtosis: 3.820911 
count if ef6==765
kdensity share_dev if ef6==765, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Computer Science") note("Female Share: 11.6%, Kurtosis: 3.82") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_cs.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_cs.pdf", as(pdf) replace
***Musikwissenschaft**
***kurtosis 9.374972**
count if ef6==830
kdensity share_dev if ef6==830, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Music") note("Female Share: 24.7%, Kurtosis: 9.37") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music.pdf", as(pdf) replace
****Human Medizin***
***  3.004102,4.61897, 3.035706  
count if ef6==440|ef6==470|ef6==490
kdensity share_dev if ef6==440|ef6==470|ef6==490, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Medicine") note("Female Share: 14.0-18.7%, Kurtosis: 3-4.62") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_music.pdf", as(pdf) replace
**** Mathematik***
***kurtosis: 4.609181 
count if ef6==340
kdensity share_dev if ef6==340, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Mathematics") note("Female Share: 15.9%, Kurtosis: 4.6") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_math.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_math.pdf", as(pdf) replace
**** Biologie**
***2.735527***
count if ef6==400
kdensity share_dev if ef6==400, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Biology") note("Female Share: 22.7%, Kurtosis: 2.74") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_bio.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_bio.pdf", as(pdf) replace
**** Psychologie***
****3.638939 
count if ef6==315
kdensity share_dev if ef6==315, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Psychology") note("Female Share: 38.7%, Kurtosis: 3.64") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_psy.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_psy.pdf", as(pdf) replace
**** Germanistik***
count if ef6==100
**kurtosis* 3.265687*
kdensity share_dev if ef6==100, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, German")  note("Female Share: 46.1%, Kurtosis: 3.27") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_german.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_german.pdf", as(pdf) replace
**** Physik***
***5.724961***
count if ef6==360
kdensity share_dev if ef6==360, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) title("Kernel density estimate, Physics")  note("Female Share: 10.9%, Kurtosis: 5.72") scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_physics.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_physics.pdf", as(pdf) replace
****Output 4****
***Korrelationen von Abweichung und Mittelwert, whole sample***
pwcorr share_dev rel_freqw, obs
***Output 5: csv file der relativen Abweichungen der Fachbereiche vom Gesamtmittelwert, ohne Namen der Institutionen***
***Die untenstehenden Daten sind ausschließlich auf Fachgebiets und Institutionenebene, der Einfachheit halber habe ich sie
***also csv file gespeichert. Die Datei enthält keine Angaben über Einzelpersonen***
drop if _freqw<3|_freqm<3
***drop wenn unter diesen Bedingungen weniger als 3 Fakultaeten***
drop if ef6==670|ef6==640|ef6==615|ef6==610|ef6==520|ef6==70|ef6==90|ef6==130|ef6==225|ef6==270|ef6==310|ef6==440|ef6==520
****Fallzahlen sind freq_total (absolute Anzahl der Professoren, groesser 3 s.o.) und die Anzahl der Fakultaeten innerhalb des Fachbereichs
by ef6: count
export delimited avd MAD per1_mad  per2_mad  per3_mad  per4_mad  per5_mad  kurtosis share_dev _freqw _freqm freq_total rel_freqw mean_ws mean_ef6 std std2 efmeans using "E:\fdz-gast10\janys_3655-2018\output\output_20180906\comp_data_ef6_deviations.txt", replace
***Output 5: Grafiken für Dep. mit mindestens 3 Frauen***
drop h
drop x
replace share_dev=0.32 if share_dev>0.32
 replace share_dev=-0.21 if share_dev<-0.21
histogram share_dev, bin(27) start(-.31208789) fcolor(dimgray) fintensity(light) lcolor(black) normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) kdensity kdenopts(lcolor(red) lwidth(thick) lpattern(solid))
twoway__histogram_gen share_dev, freq start(-.31208789) width(.02708676) gen(h x)
list x if x!=.
***Die Fallzahlen der Histogram Bins***
list h if h!=.
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_3women.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_3women.pdf", as(pdf) replace
kdensity share_dev, normal normopts(lcolor(blue) lwidth(medthick) lpattern(dash)) recast(line) xtitle(Deviations from mean) scheme(s2color)
graph save Graph "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_3women.gph", replace
graph export "E:\fdz-gast10\janys_3655-2018\output\output_20180906\kdensity_three_digit_normal_3women.pdf", as(pdf) replace

***Output 5: Grafiken für Dep. mit mindestens 3 Frauen***
***Die zu exportierenden Zahlen basieren auf Mittelwerten von mindestens 3 Fakultaeten mit jeweils mindestens 3 professoralen Mitgliedern***

collapse (mean) kurtosis efmeans MAD per1_mad std std2 per2_mad  per3_mad  per4_mad  per5_mad  _freqw _freqm freq_total rel_freqw mean_ws mean_ef6, by(ef6)
export delimited kurtosis MAD per1_mad  per2_mad  per3_mad  per4_mad  per5_mad  _freqw _freqm freq_total rel_freqw mean_ws mean_ef6 std std2 efmeans using "E:\fdz-gast10\janys_3655-2018\output\output_20180906\ef6_descriptives.txt", replace


log close

exit






